手把手教你用云E | 用FLARE FEP计算相对结合自由能
摘要
已经有大量的算例表明,Flare FEP可以可靠地预测化合物的结合亲和力。本文演示了如何借助Cloudam云E算力平台加速FLARE FEP相对结合自由能计算,包括:1)Cloudam账号注册;2)Cloudam的使用;3)云端软件安装;4)在云端启用Broker;5)客户端计算资源的配置;6)FEP项目的创建;7)FEP生成图;8)FEP计算。借助云计算资源,Flare FEP可以在2-4小时内完成一个项目的计算。
Flare FEP: GPU加速的自由能微扰
FEP简介
自由能微扰(Free Energy Perturbation,FEP)计算可用来预测同系物的相对结合亲和力变化。在FEP计算中,分子通过非物理(“炼金术”)途径逐渐转变为结构上密切相关的类似物。通过对这些互相转化的终态之间的自由能差(ΔΔG)的计算评估,可以获得与实验值相比约1kcal/mol的预测精度。
Flare内置了FEP计算工作流,支持GPU加速计算。它将AMBER Tools,OpenMM,LOMAP,Sire和BioSimSpace等开源工具与Cresset专业、直观特性相结合,为完全自动化的FEP工作流程提供了用户友好的界面(图1)。
Figure 1. Flare全自动的FEP工作流
Flare中的FEP工作流已用多种数据集完成验证[1],包括FEP+数据集作为参考基准,部分结果如表1所示。结果表明,FLARE/FEP预测性能与Schrodinger/FEP+(Wang et al.[2])相当,而大大地优于AMBER的GPU-TI(Song et al.[2])。通过Flare图形用户界面和Flare Python API,可以完全控制模拟参数,使您能够探索和设定给定配体集合及其靶蛋白的理想条件。
Table 1. FEP基准数据测试结果
GPU加速的原理
Figure 2. FEP默认采用全连接、双向网络进行计算
如图2所示,Flare默认采用全连接、双向网络进行FEP计算,每个连接(link)有9个λ窗口(默认值,可以调整),正常模式下每个连接计算两次(A->B与B->A, 即双向计算),所以每对连接在一起的分子有18个λ窗口需要计算。每个λ窗口计算都是互相独立的,因此可以同时一起进行计算。图2的网络共有8对接接,因此有8x2x9=144个λ窗口需要计算。因此,如果你有144个GPU可供使用,那么图2的网络可以在1-4个小时内完成计算,具体所需机时取决于所采用的GPU卡计算速度。
Cloudam云E算力平台:
为FEP计算提供近乎无穷的算力
Cloudam的云E算力平台整合了全球主流公有云近50个地域的高性能计算资源,开箱即用,无需硬件投入、无需运营维护、无需任务排队,支持一键式提交作业,具备自主学习与深度学习能力,能够根据用户的实例类型与计算要求智能推荐匹配合适的计算机型,将计算的虚拟损耗降至最低,提升计算效率,降低计算成本。
广州墨灵格信息科技有限公司(以下简称墨灵格或Molcalx)与深圳云端软件有限公司(Cloudam)为了方便用户对算力与安全性的需求,合作为客户提供公有云、公私混合云计算方案。在本教程中,将演示如何用Cloudam的云E算力平台来加速FEP计算。
以图2网络的FEP计算项目为例,采用10张GPU卡需要28小时完成,而采用144张卡仅需要2小时完成,而两者的计算成本是一样的:都是144*2=288GPU卡时,云计算的弹性、可扩展性优势显而易见!
计算规划与资源准备
1、在Cloudam创建账号
为了方便您体验FEP与云计算平台的便利性,Cloudam推出了初次注册账号赠送200元代金券的活动。200元足够您进行常规的学习、测试目的,以及Flare、SPARK、Forge、Ligandscout等软件基于结构与基于配体的计算方法,也足够10张卡20小时的计算机。如果您需要更多的机时进行测试,需要预先充值。
2、软件的获取与准备
我们提供Flare/FEP的测试license,在提供FEP 测试license之前,您需要与Cresset签署保密协议;此外,你还需要做必要的准备:1)准备好您的蛋白结构;2)准备好配体,这些配体应该预先对接到蛋白结合位点里;3)如果用自己的GPU计算资源,请准备好至少10GPU卡的计算集群。
如果您没有自己的GPU集群,那么我们需要收取2000元的测试费(开具发票)充值到Cloudam计算平台或者由墨灵格提供计算资源,以确保您有足够的机时进行测试。不同的测试需要使用的资源不同,因此测试费用会因具体项目的不同而不同。
注意:炼金术法相对结合自由能计算要求化合物是同系物,具有公共的骨架,化合物之间具有一定的相似性,并且电荷一致。请在准备配体结构时要注意这一点。如果不能满足这个,推荐使用WaterSwap进行绝对结合自由能计算方法,具体见:FLARE教程 | WaterSwap计算结合自由能。
注册并登录Cloudam
如果您尚未这样做,则需要注册一个云端cloudam帐户。注册后登录到控制台,如图3所示,您将看到一个首页。在首页中选择产品云E算力平台,同意法律条款,平台将赠送200元的云E算力平台代金劵,领取代金券开始创建作业。
Figure 3. 注册并登录cloudam账户
文件与目录管理
注册cloudam账户之后,将创建一个用户名为cloudam的linux用户,其HOME目录为/home/cloudam。如图4所示,首页左侧的“云E算力平台|我的云文件”可以将你的文件系统以图形的方式呈现出来。“我的云文件”的一个基本功能可以看成是filezilla或WinScp:创建目录、上传与下载文件。图2展示了“我的云文件”,可以浏览home目录下的所有文件,并可以管理(上传、下载、创建、删除等)云端的文件与目录了。
Figure 4. 我的云文件
在“我的云文件”目录树里,每个目录的右侧有三个竖点标记,点击该标记可以对该目录进行:删除、创建子目录(新建文件夹)、重命名与下载等操作;同时,在右的对话框里,可以对选中的目录里的文件或子目录进行浏览、下载等各种操作。
现在,你可以将你感兴趣的软件,上传到你的HOME目录或其他目录。在本演示中,需要将Flare与Broker上传到/home/cloudam目录(即“~”目录)。
云桌面:启动软件安装节点、ssh登录与软件安装
在Cloudam里我们需要建立桌面节点来安装软件,安装的软件将会自动挂载到作业启动的集群节点上,如有需要可以启动管理节点来帮助您更好的开展工作。
1. 启动桌面节点
如图1所示,在首页左侧,点击“云E算力平台|云桌面”,点击“开启桌面节点”,弹出“启动桌面节点”对话框(图5)。
Figure 5. 启动桌面节点对话框
从对话框可知,桌面节点分两大类:软件安装节点与作业管理节点。现在我们的目的是安装软件,因此我们点击“软件安装节点”对话框右侧的“启动”按钮即可。启动桌面节点的过程是创建启动一个linux服务器的过程,需要一点时间等待,然后会出现如图6所示的“桌面节点启动成功”的消息框。
Figure 6. 启动桌面节点启动成功消息框
2. 连接桌面节点
点击“连接桌面节点”,返回到“桌面节点”对话框(图7),会见到“软件安装节点-Linux基础版”的图标,在操作行有:终止,连接的选项。我们点击连接,切换到webssh界面(图5)。现在你可以通过shell界面来安装软件了。
Figure 7. webshell的软件安装界面
我们将在webshell里安装软件。
2.1 安装软件到/home/cloudam目录
安装Flare:
tar -Jvxf flare.tar.xz
安装Broker:
tar -Jvxf CEB2.tar.xz
2.2安装License
将license文件复制到安装目录下的cresset/licenses目录。
3. 终止云桌面
软件安装完毕,如果不继续使用webshell,则在“E云算力|桌面节点 |软件安装节点-linux基础版”里点击终止以释放桌面节点。注意:如果不进行终止操作,则会被持续计费,直到释放桌面节点。
Flare/FEP详细操作过程
1. 启动服务器端BROKER服务
1.1 启用计算节点
因为我们要使用GPU进行FEP计算,因此在“云E云算力|桌面节点|开启桌面节点”对话框,点击“桌面节点 管理节点Linux-GPU”的启动按钮,此时会弹出选择计算节点对话框。
1.2 选择计算节点
我们选择4个CPU核心、1张GPU卡的计算节点(此处我选择了“白鲸”的计算节点)就可以,每核心配2GB的内存。
Figure 8. 选择计算节点“白鲸”
1.3 webshell命令行界面
现在你进入了shell界面了(图9),与普通的Linux shell没有任何区别。
Figure 9. shell命令行界面
记住shell窗口上URL里的IP,该IP在后面会用到。
1.4 启用broker服务
Flare通过BROKER使用云端的计算资源,下面命令的"-g 200",告诉云计算平台:一次最多使用200张GPU。
module add libGLU/9.0.1-GCCcore-9.3.02
nohup ~/cresset/CEBroker2/bin/CEBroker2 -v -p 9100 -P 9101 -e -m 80 -M 20 -g 200 -s ~/cresset/CEBroker2/documentation/examples/start_SLURM_engine.sh < /dev/null > ~/cebroker/cebroker2.log 2>&1 &
2. FEP计算
2.1 Flare客户端的配置
在本地机器上,打开Flare,File | Preferences | Processing
如图10所示,在"Cresset Engine Broker"方框里,将Cloudam计算节点的IP地址填入HOST/IP,将端口填入到Port(这里是9100),然后勾选enable,点击Test Connection按钮,如果验证通过则返回"Connection OK"。
Figure 10. 本地Flare的设置
2.2 Flare/FEP: 新建FEP项目
Figure 11. 打开演示用的Flare项目
用Flare打开我们提供的Flare项目,里面包含了一个蛋白与7个已经对接到结合位点的化合物。如图11所示,在Ligand表单区(1)按住Control键,依次用鼠标点击选中需要计算的7个化合物;在Protein表单区(2),用鼠标点击准备好的蛋白5E7N_P;然后点击Flare Ligand | FEP | New FEP Project,弹出New FEP Project对话框(图12)。
Figure 12. 新建FEP项目对话框
在FEP项目对话框里,可以设置:需要计算的化合物,与这些化合物关联大蛋白;还可以设置这些化合物的活性值进行方法学验证。然后点击Create按钮。
2.3 Flare FEP生成图
上一步点击Create按钮后,弹出Flare FEP generate GRAPH对话框(图13)。
Figure 13. Flare FEP生成图对话框
Graph Type下拉菜单有两种:(1)Normal,即创建全连接网络;(2)Start graph,以选中的化合物为中心,生成星型的网络。这里,我们用Normal mode。
Mode下拉菜单有两种:(1)Benchmark模式:在该模式下,化合物的实验活性数据对计算结果不影响,适合于方法学验证;(2)Product模式:化合物的活性实验会被用于调整图的生成,并用于活性预测。在本演示里,我们选择Benchmark模式。
设置好之后,点击Generate Graph按钮,现在Flare开始云上的计算资源开始计算,生成图很快就看到结果,如图14所示。
Figure 14. Flare FEP生成图的结果
图是可以修改与编辑的,比如添加连接,修改连接方式等等。这里,我们直接开始下一步的FEP计算。
2.4 FEP计算
点击“Run FEP”按钮,弹出“Flare FEP Calculation”对话框(图15)。
Figure 15. Flare FEP Calculation对话框
我们采用默认值进行计算,所以直接点击Start按钮。注意:这里的Windows Lambda是9,从图14可知,我们的网络有8个link,每个link都是双向计算,因此总共有9x8x2=144个&lambda;窗口需要计算。
Flare FEP Calculation会实时报告目前的进度与资源的使用情况,将鼠标悬停于“More Details”旁边的文字上,会给出详细的资源使用情况,如图16所示。
Figure 16. Flare FEP Calculation资源使用情况
我们可以看到,现在使用了148张GPU卡进行各种计算。详细的计算内容,点击more details可以看到,如图17所示。
图17. Flare FEP Calculation展示详细的计算内容
完成全部计算需要1个多小时。
结果分析
略,我们已经保存了一个计算完毕的结果,可以提供给您参考。
小结
本教程演示了Flare FEP如何借助Cloudam的云E弹性计算的GPU计算资源进行FEP计算。
整个过程非常简单、便利,借助于Cloudam的近乎无穷的计算资源,将耗时、费力的FEP计算轻松完成。
云E算力平台的优势显而易见:同样的费用使用更多的计算资源,成倍地加速地获得计算结果。
文献
1.Kuhn, M.; Firth-Clark, S.; Tosco, P.; Mey, A. S. J. S.; Mackey, M.; Michel, J. Assessment of Binding Affinity via Alchemical Free-Energy Calculations. J. Chem. Inf. Model. 2020, 60 (6), 3120–3130. https://doi.org/10.1021/acs.jcim.0c00165.
2.Wang, L.; Wu, Y.; Deng, Y.; Kim, B.; Pierce, L.; Krilov, G.; Lupyan, D.; Robinson, S.; Dahlgren, M. K.; Greenwood, J.; et al. Accurate and Reliable Prediction of Relative Ligand Binding Potency in Prospective Drug Discovery by Way of a Modern Free-Energy Calculation Protocol and Force Field. J. Am. Chem. Soc. 2015, 137 (7), 2695–2703. https://doi.org/10.1021/ja512751q.
3.Song, L. F.; Lee, T.-S.; Zhu, C.; York, D. M.; Merz, K. M. Using AMBER18 for Relative Free Energy Calculations. J. Chem. Inf. Model. 2019, 59 (7), 3128–3135. https://doi.org/10.1021/acs.jcim.9b00105.
本文转载自广州市墨灵格信息科技有限公司,由云端及墨灵格共同撰写
关于云端
深圳云端软件有限公司(Cloudam)是弹性算力与云成本优化的技术领导者,为企业打造一站式的算力云平台及自动化云成本优化服务。云端软件推出的云E算力平台整合了全球主流公有云近50个地域的高性能计算资源,能为人工智能、仿真模拟、生物科技、材料化学等行业提供弹性、高效、经济的算力支持。
Cloudam成立于瑞典斯德哥尔摩,在深圳及斯德哥尔摩两地运营,团队核心成员来自于Oracle、Ericsson、IBM、华为等知名企业,拥有15年以上的世界500强企业技术服务经验和研发背景,已成功为欧洲及中国多家企业提供产品和技术服务。
现在点击左下方“阅读原文”
即可免费领取2000核时算力